概率论与数理统计 Probability and Statistics
南方科技大学 计算机科学与工程系 11812804 董正
前言 Preface
本笔记是把我曾经手写的笔记敲成电子版
第一章 概率
1.2 样本空间
1.2.1 试验
试验的概念
随机试验的特征
- 试验可以在相同的条件下重复进行
- 试验的结果可能不止一个,但试验前知道全部可能结果
- 试验的结果无法预知
随机试验用字母 表示
结果的分类
基本结果(不可分)
又称样本点、基本事件
例:掷骰子掷出 6 点
复合结果(可分解)
称为随机事件,简称事件
例:掷出 3 以上的点数
1.2.2 样本空间
试验的全部样本点构成的集合
例:掷一枚骰子,观察出现的点数
1.2.3 几种特殊事件
基本事件
一个样本点构成的单点集
必然事件
每次试验都发生的事件
不可能事件
事件域
1.2.4 事件之间的关系及运算
1.2.4.1 事件之间的关系
: 包含于
发生必然导致 发生
发生或 发生,称为 与 的和事件
与 同时发生,称为 与 的积事件,可记作
( 可以是 )
发生 不发生,称为 的差
若 , 则称 为真差
也记作 (存疑)
若 ,则称 互斥(互不相容)
不可同时发生
若 且 ,则称 互为对立事件(逆事件)
1.2.4.2 运算律
交换律
结合律
分配律
摩根律
1.3 概率测度
1.3.1 频率
1.3.2 概率
概率的公理化定义 (柯尔莫哥洛夫, 1933)
设 为样本空间 上的事件域,,若 与其对应,且满足
非负性
规范性
可列可加性
对两两不相容的事件列 有
则称 为事件的概率,称 为概率空间
概率的性质
证明:
(可列可加性)
有限可加性
若 是两两不相容事件,则
若 则
证明:
互斥事件,根据有限可加性,
加法定律 (很重要)
挖补原理
规律:加奇减偶
例:已知空气中 PM 2.5 含量一般在 到 , SO2 含量一般在 到 之间,PM 2.5 含量在 或 SO2 含量在 以上,则认为空气有害。求空气有害的概率
几何概型

1.4 概率计算
1.4.1 古典概型
古典概型的概念
排列组合
加法原理
做一件事有 类方法,第 1 类有 种方法,第 2 类有 种方法...第 类有 种方法
则方法总数
乘法原理
做一件事有 个步骤,第 1 步有 种方法,第 2 步有 种方法...第 步有 种方法
则方法总数
1.4.2 几何概型
随机试验
向平面有界区域 投掷一个点
样本空间
事件
点落在可测量面积的平面区域
事件概率
则称上述试验为几何概型
- 事件 发生的概率与位置无关,只与 的面积有关,这体现了某种等可能性
- 一维或者三维的情况就是长度、体积
1.4.3 习题
证明
证明:
由加法定律,
证明
证明:
即证
即证
原式得证
把 个 与 个 随机排列,求没有两个 连着的概率
可以看成有 个位置,只需要考虑 1 放在哪里,剩下的自然是 0
共 种放法
接下来,用 0 把 1 隔开,需要 个 0,还剩一个,考虑把它插到哪里
1 0 1 0 1 0 ...
这两个位置效果一样,都是 1001,所以我们就假设这个 0 只插到 1 的右边,这样有 种插法。还有一种是插在开头,所以一共 种
袋子中有 个黑球和 1 个白球,每次从口袋中随机摸出一个球,并放入一个黑球,求第 次摸球时摸到黑球的概率
设 第次摸到黑球,则 第次摸到白球
考虑 的情况:
因为袋子中只有 1 个白球,所以前 次摸到的都是黑球
掷 颗骰子,求出现点数最大为 5 的概率
设 最大点数为最大点数不超过最大点数不超过
且
个人围一圆桌坐,求甲、乙两人相邻的概率
假设甲先坐好,则乙只有两个位置可坐
1.5 条件概率
定义
令 表示两事件,且 。给定事件 发生的条件下 发生的条件概率为
不是一个事件
性质
非负性
规范性
必然事件 ,
可列可加性
设 为两两不相容的事件列,则
条件概率也满足概率的公式
乘法定律:求“ 个事件同时发生的概率”
定义
推广
若 ,则
全概率定律:求“最后结果”的概率
样本空间的分划
设 为样本空间,若 满足
- 两两不相容
则称 为样本空间的一个分划
公式
证明:
例:10 件产品中有 3 件次品,从中不放回地取两次,求第二次取得次品的概率
解:
设 第二次取得次品第一次取得次品
全概率公式:
贝叶斯公式:已知“最后结果”,求“原因”的概率
若 为导致试验结果的原因,则称 为先验概率
若试验产生事件 ,则要探讨事件发生的原因
称 为后验概率, 为原因概率
实际上就是条件概率的分子分母用乘法定律和全概率公式拆开
发生时发生的概率同时发生的概率发生的概率
例 1:某工厂的三个车间,产量分别占 ,次品率为 。现在任取一产品发现为次品,则该次品是哪个车间生产的可能性最大
解:
设 取到次品,次品是第个车间生产的
全概率公式:
贝叶斯公式:
2 车间生产的可能性最大
例 2:某测谎仪,- 表示说真话,+ 表示测得说谎。T 表示人说的是真话,L 表示人在撒谎
已知
若有一人测试时显示 +,求测谎仪出错的概率
解:
贝叶斯公式:
1.6 独立性
定义
若 ,则称 相互独立
独立,则 相互独立
独立和互不相容的区别
不可能既独立又互不相容
三个事件的独立性
两两独立且
- 若 三三独立,则 都与 独立
个事件的独立性
若 个事件 满足
则 相互独立
就是两两独立、三三独立、四四独立、... nn 独立才叫互相独立
与任何事件都相互独立
若 独立,,则 相容
例 1:设一支枪击中目标的概率 ,求 支枪齐射命中的概率
解:
记 第支枪命中目标
由题意 相互独立
则
例 2:三门炮击中飞机的概率分别为 ,飞机被一门炮击落的概率为 ,被两门炮击落的概率为 ,被三门炮打中必定被击落,求飞机被击落的概率
解:
记 飞机被击落
飞机被门炮击中
第门炮击中飞机
则:
所以
全概率公式:
第二章 随机变量
2.1 离散随机变量
- 若变量 仅取有限或可列个值,则称 为离散型随机变量
2.1.1 概率质量函数 PMF
定义
又称频率函数
性质
正则性
以上两条为本质特征(充要条件)
表示方法
分布列
矩阵
2.1.2 累积分布函数 CDF
2.1.3 离散随机变量的分布
单点分布(退化分布)
随机变量 的 CDF 为 ,称 服从单点分布
记作 或
(0-1) 两点分布(伯努利分布)
若随机变量 的频率函数 ,则称 服从 (0-1) 两点分布
二项分布
伯努利试验
只产生两个结果 的试验
重伯努利试验:将伯努利试验独立重复 次的试验
公式
重伯努利试验中 发生的次数
称 服从参数为 的二项分布,
最大值(中心项)
当 为正整数时, 为最大值
是最可能出现的次数,不是正整数就取整
时退化为 (0-1) 两点分布
几何分布
,前 次全部失败,直到第 次才成功
记作
负二项分布
进行试验直到 次成功,用了 次
记作
超几何分布
盒中有 个球, 个黑球, 个白球,从盒中无重复抽取 个球,设 为抽到黑球的次数
先从 个黑球中选 个,再从 个白球中选 个
泊松分布
泊松流
随时间推移,在时间轴上源源不断出现的随机粒子流
例:某商店某天的顾客
泊松分布
为区间 中出现的粒子数
为参数
记作 或
常用 (一个顾客都没有):
性质
泊松分布与泊松流的关系
称为泊松强度
泊松定理
设 为常数, 为正整数,,则
当 很大 很小时,根据泊松定理
多项分布:二项分布的推广
进行 次独立试验,每次试验有 种可能的结果,概率为
令 是 次试验出现第 种结果的总次数,,则 的联合频率函数
例:抛硬币 10 次,每次有 概率正面, 概率反面, 概率立起来,求出现 4 次正面 3 次反面的概率
解:
设 次正面, 次反面, 次立起来
多维超几何分布
口袋中有 只球,分为 类。第 种球有 只,
从中任取 只,记 为取出的 只球中第 种的个数,则 的分布为
2.2 连续随机变量
2.2.1 概率密度函数 PDF
定义
若随机变量 的分布函数能表示为 ,其中 ,则称 为连续型随机变量,非负可积函数 称为密度函数
性质
正则性
几何意义:面积表示概率
在 的连续点处有
,但是不代表是不可能事件
在 处的高度越大,则 取值在 附近的概率越大。在某点密度曲线的高度反映了概率集中在该点附近的程度
- 分位数
设 ,若 , 常数 满足 ,则称 为密度函数的 分位数
2.2.2 连续随机变量的分布
均匀分布
若 r.v. 的密度函数为
则称 服从区间 上的均匀分布,记作
指数分布
若 的密度函数为
则称 服从参数 的指数分布,记作
失效率, 平均寿命
分布函数
无记忆性
伽马分布
若 的密度函数为
其中 为常数,则称 服从参数为 的 分布,记作
形状参数
尺度参数
正态分布
定义
若 的密度函数为
则称 服从参数为 的正态分布,记作
性质
- 关于 对称
- 在 处取极大值 ,左增右减
- 以 轴为渐近线
图像
位置参数, 增大,图像右移
刻度参数, 增大,图像变尖(高瘦)
标准正态分布
分布函数:
对称性:
计算
一般正态分布与标准正态分布的转换
若 ,设 ,则
原则
贝塔分布
时为均匀分布
记作
称 为贝塔函数
2.3 随机变量的函数
2.3.1 离散随机变量函数的频率函数
离散型+离散型
设 r.v. 的频率函数为
则 的频率函数为
| | | | | |
|---|
| | | | | |
相同合并
例: 的频率函数为
求 的频率函数
解:
| | | | | |
|---|
| | | | |
合并后:
连续型+离散型
例:设 r.v. ,定义
求 的频率函数
解:
因此 的频率函数为
2.3.2 连续型随机变量函数的分布
计算流程
求 的分布函数
转化为求 的概率计算问题
需要用到函数 的性质
求导
例 1:设 r.v. 的密度函数为
求 的密度函数
解:
先求 的分布函数
其他
其他
其他
例 2:设 r.v. 的概率密度函数为 ,求 的密度函数
解:
综上
例 3:设 r.v. 的概率密度函数为 , 单调递增且处处可导,求 的密度函数
解:
单调递增
处处可导
设 r.v. 的密度函数为 , 严格单调,其反函数 连续可导,则 的密度函数为
有意义其他 推论:r.v. 的密度函数为 , 在互不相交的区间 上逐段严格单调,且其反函数 均连续可导,则 的密度函数为
有意义其他 例 5:设 ,求 的密度函数
解:
设 ,则 时 严格单调递减, 时 严格单调递增,反函数分别为
2.4 第二章习题
设 且 , 为 的分布函数,则对任意实数 ,求
解:

根据偶函数的性质,阴影部分面积相等
即
设 的分布函数
求
解:
经验表明:预订餐厅座位而不来就餐的顾客的比例为 20%。现在餐厅有 50 个座位,但预订给了 52 个人,求顾客到来时餐厅没有空位的概率
解:
设 为 52 位顾客中不来的人数
由题意,顾客鸽了的概率
餐厅中没有空位 最多俩人鸽了
设 的概率密度函数 满足 且 ,求
解:
作图

计算
令
原式
令
原式
设 , 为常数,求
解:无记忆性
设 ,求
解:
已知 且 求
解:
且
设 ,记
则 个别
解:
设随机变量 且
则必有
解:
同理
单增
设 为标准正态分布的概率密度, 为 上均匀分布的概率密度
若 为概率密度函数,则 满足
解:
其他
设 ,求 的概率密度
解:
设 ,求 的密度函数
解:
时
时
第三章 联合分布
3.1 联合累积分布函数
二维随机变量
设 为样本空间, 是定义在 上的两个 r.v.
记 称 为二维随机变量或二维随机向量
分布函数
概念
设 为二维随机变量。,定义
称 为 的联合累积分布函数
几何意义:落在 左下方区域的概率
概率计算

多减了一块阴影
性质
任意固定 , 是 的单调不减函数
任意固定 , 是 的单调不减函数
关于 右连续
关于 右连续
有
这一条不能由前三条推出,例如
3.2 二维离散型随机变量
3.2.1 联合频率函数
概念
设 r.v. 的所有可能取值为 ,取值的概率为
称上式为 的频率函数或联合频率函数
性质
非负性
正则性
3.2.2 边际分布
概念
称 为 关于 的边际分布函数, 是关于 的边际分布函数
同理
边际分布完全由联合分布决定
边际频率函数
设 的频率函数为
则 的频率函数是
同理 的频率函数
称数列 为 关于 的边际频率函数, 为关于 的边际频率函数
例:设 从 中等可能取值, 从 到 中等可能取值,求 的联合频率函数以及各自的边际频率函数
解:
的取值为 ,当 时, 的取值为 。由乘法公式,
所以联合频率函数为
| | 1 | 2 | 3 | 4 | |
|---|
| 1 | | | | | |
| 2 | 0 | | | | |
| 3 | 0 | 0 | | | |
| 4 | 0 | 0 | 0 | | |
| | | | | |
边际频率函数为
| | 1 | 2 | 3 | 4 |
|---|
| | | | | |
3.3 二维连续型随机变量
3.3.1 联合概率密度函数
概念
设 r.v. 的分布函数为 ,若存在非负可积函数 使得 ,则称 为 的联合概率密度函数
性质
曲顶柱体的体积
在 的连续点处有
混合二阶偏导
例: 的概率密度为 其他
求:(1) (2) (3)
解:
(1)
(2)
其他
其他
其他
(3)
记 ,则

3.3.2 二维连续变量的边际密度函数
边际密度
的分布函数
则 的边际密度函数为
同理
注意积分的上下限根据题意找范围
例:其他 求
解:
时
时
时
时
综上,
Farlie-Morgenstern 族
设 是一维连续型分布函数,则
是二元连续分布函数
其边际分布
给定边际分布,可以构造无数个不同的二维联合分布
连接函数 coupla
边际分布为均匀分布的联合累积分布函数,记作
性质:
关于每个变量都是不减的
讨论具有密度函数的连接函数,此时
若 是分布函数分别为 和 的连续随机变量,则 和 是均匀分布随机变量。对于连接函数 ,定义联合分布 ,则其边际分布为 ,相应的密度为
说明:两个边际分布与任意的连接函数,可以构造出相同边际分布的联合分布,即:边际分布不能决定联合分布,两个变量的相依性由连接函数控制
3.3.3 二维正态分布
若 的联合密度为
则称 服从参数为 的二维正态分布,记作
其中各参数
定理:若 则
正态密度的图形及边际密度的几何意义
边际密度是正态曲线
:固定 ,截面曲边梯形的面积
相互独立
给定 时 或给定 时 的条件密度是一维正态分布
两个边际密度是正态分布的变量,联合分布不一定是二维正态分布
对于二维正态分布,独立 不相关
3.4 独立随机变量
独立变量
设
若 ,有 ,即
则称 相互独立
直观意义
的取值是相互独立、互不相干的
事件 独立
判定相互独立
- (本质定义)
独立 可分离变量,
二维离散型随机变量的独立性
设 的频率函数为
则 相互独立等价于 ,有
二维连续型随机变量的独立性
设 为连续型随机变量且
若 相互独立,则
从而在 的连续点处有
例:在某一分钟内,信号进入收信机是等可能的。若收到两个互相独立的信号间隔为 0.5 秒,则信号产生相互干扰,求两信号互相干扰的概率
解:
设两信号进入收信机的时间分别为 分钟,则
独立
其他

维随机变量的边际分布和独立性
一维边际分布
设 维随机变量的分布函数
则 的边际分布
即
二维边际分布
即
类似地可定义高维边际分布
随机向量的独立性
,若
则称 相互独立
两个向量的独立性
设
且
,若有 ,则称 相互独立
定理
设 相互独立,则
相互独立
设 分别为 元和 元的连续函数,则
依然相互独立
3.5 条件分布
3.5.1 条件频率函数
定义
设 的频率函数为 ,对于确定的 ,若
则 为在 的条件下, 的条件频率函数
同理
性质
- 非负性
- 正则性
3.5.2 条件概率密度
定义
设 的概率密度为 ,若对于固定的 , 关于 的边际密度 ,则称
为在 的条件下, 的条件密度
为 条件下, 的条件分布
性质
非负性
正则性
连续情形的全概率公式
对 积分 (边际分布的定义)
平面上的均匀分布
设 是平面上的有界区域,其面积为 ,若 的概率密度为
其他,则称 服从区域 上的均匀分布,记作
边际密度不一定是均匀分布
3.5.3 例题
设随机变量 ,求 和 的联合分布列
解:
综上, 的分布列为
| 0 | 1 |
|---|
| 0 | 0.0455 | 0.2719 |
| 1 | 0 | 0.6826 |
服从区域 上的均匀分布,求 的边际密度
解:
由题意 其他
或 时
时
综上, 的边际密度为
其他

设 的密度函数为 其他,求
解:

3.6 联合分布随机变量函数
3.6.1 连续型
卷积公式
若 相互独立,则 的密度函数为
证明:

独立正态随机变量的和
, 独立
则
相互独立且
则对于不全为 0 的常数 有
例 1:独立变量 的概率密度均为 其他
求 的概率密度
解:
由卷积公式,
被积函数的非 0 区域

其他其他
3.6.2 离散型
卷积公式(离散)
设 独立,
则 的频率为
例 2: 独立且 ,求 的分布
解:
由离散卷积公式
二项分布
二项式
3.6.3 的分布
的计算
设
令 ,则
则
当 独立时

柯西分布
例 3:设 独立且密度函数均为 ,求 的密度
解:
时 的分布函数
综上,

例 4: 独立且服从标准正态分布,求 的概率密度
解:
,则
偶函数积一半
换元 ,(利用 )
服从标准柯西分布
3.6.4 两个随机变量变换的分布
设 独立且服从标准正态分布,且
则
- 推论 1:两个独立标准正态 r.v. 的线性变换服从二元正态分布
- 推论 2:两个 r.v. 的联合分布是二元正态分布,则它们的非奇异线性变换仍服从二元正态分布
例 6:设 独立,概率密度均为
求 的联合密度,并证明 独立
解:
令 ,则
可表示为
相互独立
3.6.5 随机变量的其他函数
变量变换法:
已知 的分布, 为 的函数 ,求 的分布:
若 存在反函数
则 的联合密度为
其中
例 7: 独立,密度函数分别为 ,求 的密度函数
解:
设
解题步骤:
- 设变量
- 求
- 求
- 代入得
- 求边际密度得
例 8:设 独立且均服从 ,求 的概率密度
解:
时 的分布函数为
换极坐标
这样的分布称为瑞利分布

例 9:设 独立,,求 的密度
解:
其他
卷积公式:
找积分范围:

另一条卷积公式:

3.7 极值和顺序统计量
3.7.1 极值 和 的分布
且 独立
且 相互独立
独立同分布时
独立且概率密度均为
3.7.2 顺序统计量 的分布
概念
将独立同分布的 r.v. 从小到大排序为
最小值 ,最大值
若 ,则中位数为
求 的密度

第个在个在左边个在右边
区间上均匀分布的
其他
代入公式得 ,即
推论:因为密度函数积分 = 1
求

对于均匀分布
3.8 第三章习题
已知 的联合密度为 其他,问 是否独立
解:看 是不是等于
求边际密度:
, 独立
设 的联合密度为 ,求证 独立的充要条件为 可分离变量,即
证明:
充分性: 独立
必要性:令
独立
设 服从圆域 上的均匀分布,求
解:
其他
其他
其他其他
第四章 随机变量的数字特征
4.1 随机变量的期望
4.1.1 离散型随机变量的期望
4.1.2 连续型随机变量的期望
定义
若 ,则 为 的期望
几种分布的期望
| |
|---|
| |
| |
| |
| 柯西分布 | 不存在 |
马尔科夫不等式
设 满足 且 存在,则
证明:
4.1.3 随机变量函数的期望
4.1.4 数学期望的基本性质
,则
为常数,则
2, 3 为期望的线性性质,即线性变换的期望等于期望的线性变换
独立,则
逆命题不成立
不独立时
推论 1
若 ,则
推论 2
设 为常数, 为 r.v.,则
推论 3
设 独立,则
例 1:公交车有 20 名乘客,途中有 10 站,若没人下车则不停。每位乘客在任一车站下车的概率等可能。以 表示停车的次数,求
解:
设 第站有人下车第站没人下车
名乘客都不在第 站下车
相似应用:超几何分布的期望
例 2:其他
求 (1) (2)
解:(1) 求 (2) 性质
(1)
(2)
4.2 方差与标准差
定义
方差
对 r.v. ,若 存在,则称 为 的方差
标准差
量纲同随机变量的量纲
意义
偏离均值的平均大小
离散程度,越大越分散
计算
离散型
,则
连续型
设 的概率密度为 ,则
例 1:,求
解:
例 2:,求
解:
例 3:其他,求
解:
方差的性质
但是 不能推出 ,可以推出
,上下移动不影响方差
独立或者不相关时
几种分布的方差
-
切比雪夫不等式
,则
证明:
对 应用马尔科夫不等式:
由于 等价于
4.3 协方差与相关系数
4.3.1 协方差
4.3.2 相关系数
定义
称 为 的相关系数
或者用公式:
均方误差
用 线性拟合,记均方误差
最小时
性质
几乎处处线性相关
正相关
负相关
不相关
不相关指的是没有线性关系
二维正态 ,则
独立与不相关
独立一定不相关,不相关不一定独立
独立:没有任何关系
不相关:没有线性关系
特例:二维正态
4.3.3 矩
阶原点矩( 阶矩)
阶中心矩
阶混合矩
阶混合中心矩
:一阶矩
:二阶中心矩
:二阶中心混合矩
4.3.4 协方差矩阵
定义
对于二维随机变量 ,记
记 为 的协方差矩阵
性质
- 对称:
- 正定:
4.4 条件期望
定义
的条件下, 的条件期望定义为
的函数 的期望
性质
全期望公式
外层 内层
证明(离散情形):
全概率公式
随机和
, 为 r.v. 且具有有限期望与方差, 具有相同的均值 和方差 , 与 独立
举例:进入商场的顾客数为 ,第 个顾客的消费数额为
计算
即:完成 个工作的平均时间是随机数 的平均值乘以完成一个工作的平均时间
即:总时间 的不确定性来源于 的随机性和 的随机性(若固定 ,则 )
4.5 第四章习题
个人, 份礼物,任意取, 为拿对自己礼物的人数,求
解:
记 第个人拿对自己的礼物第个人未拿对自己的礼物
设 ,则
计算 的期望:
的分布如下所示,求 (1) (2)
| 0 | 1 | 2 | |
|---|
| 0 | | 0 | | |
| 1 | 0 | | 0 | |
| 2 | | 0 | | |
| | | | | |
解:
(1)
(2) 求 的边际分布和 的分布
其他,求
解:
设二维连续随机变量 的联合密度函数为 ,求
解:先求
时
其他
设 存在,证明
证明:
是 的函数,记
为实数
(常量的均值等于自己)
设 独立且均服从参数为 的指数分布,求 的相关系数
解:先求
设 , 独立则
结果与服从什么分布无关
设 服从标准柯西分布,,求
解:
不存在
第五章 大数定律和中心极限定理
5.1 大数定律
5.1.1 背景
概率的产生
随机试验 统计数据 统计规律 频率稳定性 概率
频率稳定性
设 次独立重复试验中事件 发生的次数为 ,当 时
依概率收敛
设 为一列随机变量,若 ,有 ,则称随机变量列 依概率收敛于 ,记作
5.1.2 大数定律
伯努利大数定律
设 是 次重复试验中事件 发生的次数,且 ,则 ,有
切比雪夫大数定律
设 为相互独立的随机变量列,且具有相同的期望和方差,记 ,则 有
辛钦大数定律
设 是独立同分布的随机变量列, 存在,则 有
大数定律的一般形式
若 满足 ,则称 服从大数定律
马尔科夫大数定律
若 满足 则 服从大数定律
5.2 中心极限定理
5.2.1 背景
现实中很多数量指标都服从或近似服从正态分布
这些指标通常是由大量相互独立的随机因素综合影响而成,即
中心极限定理研究的内容: 时,什么情况下 的极限分布为正态分布
即 是否服从标准正态分布
5.2.2 中心极限定理
定义
若 的分布函数 对任意 满足
则称 服从中心极限定理
独立同分布的中心极限定理(林德伯格-列维中心极限定理)
为独立同分布的随机变量列,,则 服从中心极限定理,即 近似服从标准正态分布,或 近似服从
棣莫弗-拉普拉斯中心极限定理
设 为服从 的随机变量列,则 ,
即 近似服从
例:某单位电话交换机有 500 部电话,在所有通话中有 96% 的通话是在各分机内进行的。假定每部分机是否需要打外线是相互独立的,问要配备多少条外线才能以 95% 的概率保证每个分机要用外线时不必等候?
解:
在任一时刻,记 第台分机要用外线其他
则 独立同分布,且
由独立同分布的中心极限定理, 近似服从
设需要 条外线才能满足要求,则应有
设 ,则
,查表得
至少应该配备 28 条外线
5.3 第五章习题
设 是独立同分布的随机变量序列,其共同分布为 ,问 是否服从大数定律
解:
存在,由辛钦大数定律知 服从大数定律
每袋味精的净重为随机变量,平均重量为 100g,标准差为 10g,一箱内装有 200 袋味精,求一箱味精的净重大于 20500g 的概率
解:
设第 袋味精的净重为 ,则 独立同分布且
由独立同分布的中心极限定理,总净重 近似服从
因此,一箱味精的净重大于 20500g 的概率为 0.0002
第六章 数理统计的基本概念与抽样分布
6.2 数理统计的基本概念
总体
研究对象的数量指标
个体
r.v. 的值
- 例:考察某班级学生的英语课程学习成绩 ,因为每个学生的成绩都在全班平均成绩 的附近波动,所以总体可视为
抽样与样本
从研究对象中抽取 个个体,观察它们的数量指标 ,这一过程称为抽样, 称为容量为 的样本
抽样的特点
- 在相同条件下对总体 进行 次重复、独立的观察
- 独立性:各次取样的结果互不影响
- 代表性:每次取出的样本与总体有相同的分布
样本的二重性
- 观察前: 是相互独立,与总体同分布的随机变量
- 观察后:样本值 是 个具体的观察数据
例:某厂生产了一大批灯泡,现从中随机抽取 5 只进行检测,测得其寿命(小时)分别为 980、960、1030、1300、850
分析:
总体为灯泡的寿命
样本容量为 5,样本为
样本观察值为
样本的分布
样本 为多维随机变量
若总体分布函数为 ,则样本联合分布函数为
若总体密度为 ,则样本联合密度函数为
例:设 为来自总体 的样本,求样本分布
解:
总体的频率函数
统计量
设 为来自总体 的样本, 为 元函数,若 r.v. 不含任何未知参数,则称 为统计量
例:样本的均值、最值、样本方差
统计量也有二重性
常用统计量
- 样本均值:
- 样本方差:
- 样本 阶矩:
- 样本 阶中心矩:
- 顺序统计量
- 极大值
- 极小值
样本矩的特性
总体 阶矩
独立,与 同分布,由辛钦大数定律,
样本均值与样本方差的数字特征
设总体 的方差和均值 均存在, 是来自总体 的样本,则
证明:
6.3 抽样分布
6.3.1 分布(卡方分布)
定义
设 是来自总体 的样本,令 ,称 服从自由度为 的 分布,记作
密度函数

自由度
- 直观理解:可独立变化的变量个数
- 严格理解:二次型 的秩
性质
可加性
独立且 ,则
数字特征
设 ,则
6.3.2 分布
6.3.3 分布
定义
设 且 相互独立,令 ,称 服从自由度为 的 分布,记作
密度函数

性质
- ,则
分位点
设 ,若 满足,则称 为分布密度 的 分位点
的 分位点记作 ,
例:求 ,则 ,查表得
的 分位点记作
时可以近似认为是标准正态分布,查
的 分位点记作
充分大时
的 分位点记为
三反公式:
6.3.4 抽样分布定理
设 是来自总体 的样本,则
设 是来自总体 的样本,则
- 相互独立
设 是来自总体 的样本, 分别为样本均值和方差,则
可用 代替
设 是来自总体 的样本, 是来自总体 的样本,且两样本相互独立,两样本均值与方差为 ,则
设 是来自总体 的样本, 是来自总体 的样本,且两样本相互独立,两样本均值与方差为 ,则
证明:
注:
标准化:
原式
原式
第七章 参数估计
7.1 点估计